2025-03-10 16:04:04.AIbase.
Huawei Ascend et Step-Video lancent un modèle multimodale open source, faisant leur entrée dans le nouveau domaine de l'IA
2025-02-27 09:38:31.AIbase.
Microsoft lance Phi-4, un modèle multimodal et miniature améliorant le traitement de la voix, de la vision et du texte
2025-01-28 10:34:39.AIbase.
DeepSeek lance Janus-Pro, un nouveau modèle multimodal révolutionnaire
2025-01-15 08:41:23.AIbase.
Alibaba Damo Academy lance Valley 2, un grand modèle multimodal pour le commerce électronique
2025-01-08 17:10:10.AIbase.
Hu Han, ancien expert en vision chez Microsoft, rejoint Tencent pour diriger le développement du modèle multimodal HunYuan
2024-12-11 08:30:31.AIbase.
Visuel Chine et Vidu de Shengshu Technology collaborent pour développer une solution de génération de contenu vidéo IA
2024-11-19 09:54:07.AIbase.
Mistral lance Pixtral Large, son modèle multimodal open source le plus puissant, et améliore Le Chat pour un accès direct à Flux Pro
2024-10-21 14:22:41.AIbase.
Emu3 révolutionne Stable Diffusion ! Un nouveau modèle multimodale révolutionnaire de l'Institut BAAI.
2024-09-27 17:37:02.AIbase.
Emu3 : Un modèle multimodal révolutionnaire qui comprend les images et les vidéos en prédisant le mot suivant
2024-09-20 09:06:14.AIbase.
Ali International lance Ovis, son nouveau modèle multimodal de grande envergure : identifier un plat pour obtenir les étapes de sa préparation
2024-09-12 09:14:39.AIbase.
Le géant français de l'IA lance une offensive sur le marché multimodal : Mistral AI publie le modèle Pixtral 12B de compréhension d'images et de texte en open source
2024-09-03 08:49:41.AIbase.
MiniMax : 3 milliards d'interactions quotidiennes avec les utilisateurs, lancement d'un modèle multimodale abab7
2024-08-26 13:54:33.AIbase.
Cloudminds lance Shanhai, un grand modèle multimodal : changement de timbre vocal libre et compréhension des scènes visuelles
2024-08-19 14:44:01.AIbase.
Alibaba lance mPLUG-Owl3, un grand modèle multimodal capable de résumer un film de 2 heures en 4 secondes
2024-08-16 17:23:10.AIbase.
Mellanox et iPerception Intelligence concluent un partenariat et achèvent l'adaptation du modèle multimodal « Une feuille légère »
2024-08-02 09:04:21.AIbase.
Google lance Gemini 1.5 Pro, un modèle multimodal puissant en version expérimentale, surpassant GPT-4o et Claude-3.5 Sonnet
2024-07-17 14:54:02.AIbase.
Qwen2-Audio : un modèle multimodal audio de la série Qianwen, interaction vocale sans texte
2024-07-17 13:47:02.AIbase.
L'institut de recherche sur l'intelligence artificielle de Beijing lance EVE, un nouveau modèle multimodal vision-langage sans encodeur
2024-07-04 16:07:51.AIbase.
Dévoilement de trois modèles par LeapStar, dont Step-2, axés sur les capacités multimodales
2024-07-04 15:57:03.AIbase.